, c5.0 모형을 적합시킨다.
적합한 모형을 찾아낸다.
신경망을 통한 중요변수를 찾아낸다.
. 클레멘타인을 이용한 K-means 군집분석
처음 7개의 군집수로 군집분석 실시!!
군집수가 많을수록 분류기준이 애매하여, 군집의 수를 하나씩 줄여나갔다.
군집수가 5개일 때 비교적 군집분석 결과 해석 용이.
K-means 군집분석
먼저 신경망분석을 통해 선택된 중요한 변수 중 순서대로 다음과 같은8개의 변수로 군집분석을 실시하여 7개의 군집으로 나누었을 때에는 군집 별 특징을 나누기가 까다로웠다.
따라서, 비교적 군집분석 결과를 해석가능하기 용이한 5개의 군집으로 나누었다.
▶해결방안 모색:
Ⅱ. Data
1. 변수소개
본 프로젝트에서 사용된 맥주 브랜드는 총 21개이다. (Cass fresh, Casslight, Max, Dryfinishd, Hite, Budweiser, Heineken, Hoegaarden, Asahisuperdry, Tsingtao, Sanmiguel, Mudshake, KGB, Crusier, Obgoldenlarger, Guiness, Miller, Cafri, Sapporo, Kirinichibang, Hoochi) 위 맥주 브랜드는 대형 마트나 맥주 전문점에서 구입할 수 있는 보
도전추구 유형은 주로 일본인. 총 사용금액, 게임 이용시간, 배팅금액에서 타 군집과 구별되는 특징을 보이지 않는 것으로 분석
창조지향 유형의 군집은 주로 중국 국적. 100만원 이하의 카지노 총 사용금액. 2시간에서 5시간의 게임을 이용. 1회 평균 배팅금액이 3만원 대
유행추구 유형은 주로 한
3.통계분석
3.1 상관분석
두 변수 간의 상관관계를 알아보기 위해 상관행렬을 구해보았다. 상관도가 1에 가까울수록 두 변수 간의 연관성은 높다고 할 수 있다. 표 <3.1>의 상관행렬을 살펴보면 RATE(평균 시간당 임금)와 가장 높은 상관관계를 가진 변수는 school(최종학력)이다. 각각의 상관도를 살펴
제 1절 군집분석의 의의
군집분석이란 ?
다양한 특성을 지닌 대상들을 동질적인 집단으로 분류하는 데 이용되는 기법.
대상들의 유사성을 측정하여 유사성이 높은 대상들을 집단으로 묶어줌으로써 집단 별 특성 등을 연구할 수 있게 해주는 분석 방법
* 세 가지 중심사항
각 대상들이 얼마나 비슷
- 다수 대상들(소비자, 제품 등)을 그 특성을 토대로 유사한 대상들끼리 그룹핑하는 기법.
- 군집내의 구성원들은 가급적 유사하게, 군집들 간에는 가급적 상이하게 그룹핑.
- 요인분석과의 차이: 무엇을 그룹핑하는가?
- 판별분석과의 차이: 분석이전에 집단이 나누어져 있는가?
- 마케팅에 적용
Clustering (군집화)
정의
하나의 객체(object)가 여러 속성(attribute)을 갖는다 하고 이러한 객체가 다수 있다고 할 때 군집분석이란 유사한 속성들을 갖는 객체들을 묶어 전체의 객체들을 몇 개의 그룹 또는 군집(cluster)으로 나누는 것.
수리적 정의
전체 n개의 객체가 있다고 할 때 이들을 서로 배타적